我们解决了一个新的新兴问题,该问题正在加权图中找到最佳的单核匹配。\ cite {adma}在每次迭代中采样完整匹配的半频带版本,创建了一个算法,预期的遗憾匹配$ o(\ frac {l \ log(l)} {\ delta {\ delta} \ log(t))$带$ 2L $播放器,$ t $迭代和最小奖励差距$ \ delta $。我们分两个步骤减少了这一界限。首先,如\ cite {grab}和\ cite {unirank},我们在适当的图上使用预期奖励的无模式属性来设计算法,并遗憾地在$ o(l \ frac {1} {\ delta} {\ delta} \ \log(t))$。其次,我们表明,通过将焦点转移到主要问题`\ emph {用户$ i $比用户$ j $更好?}'这个遗憾变成$ O(l \ frac {\ delta}}^2} \ log(t))$,其中$ \ tilde {\ delta}> \ delta $源自比较用户的更好方法。一些实验结果最终表明这些理论结果在实践中得到了证实。
translated by 谷歌翻译